КВАНТОВАЯ СЕМАНТИЧЕСКАЯ МОДЕЛЬ ПОИСКА ТЕКСТА НА АРАБСКОМ ЯЗЫКЕ
Аннотация:
Предмет исследования. Рассмотрен процесс извлечения семантики из текстов на арабском языке. Изучена применимость к парам слов теста Белла как мера семантической связанности слов в контексте. Приведены результаты исследования применимости квантового формализма к информационному поиску в текстах на арабском языке. Показано влияние ширины контекста на результативность информационного поиска. Метод. Предлагаемая модель поиска базируется на векторном представлении контекста с помощью известного подхода на основе матрицы Hyperspace Analogue to Language (HAL) и теста Белла. Матрица HAL позволяет учитывать частоты встречаемости слов контекста и дистанцию до целевого слова. Использование квантовой теории, оперирующей матрицами плотности вероятностей, позволяет более естественным образом описывать вероятности в векторном представлении слов. Основные результаты. Полученные результаты демонстрируют, что использование теста Белла для текстов на арабском языке обеспечивает лучшее ранжирование результатов поисковой выдачи по сравнению с результатами поисковых сервисов. Практическая значимость. Результаты исследования могут использоваться при разработке информационно-поисковых систем, а также для дальнейшего развития методов на основе дистрибутивной гипотезы.
Ключевые слова:
Постоянный URL
Статьи в номере
- К ВОПРОСУ ОБЕСПЕЧЕНИЯ БЕЗОПАСНОСТИ ПРОМЫШЛЕННЫХ СИСТЕМ
- АНАЛИЗ ДОПОЛНИТЕЛЬНЫХ ПОГРЕШНОСТЕЙ ОПТИКО-ЭЛЕКТРОННОЙ СИСТЕМЫ КОНТРОЛЯ ПОЛОЖЕНИЯ ЖЕЛЕЗНОДОРОЖНОГО ПУТИ
- О ВЫБОРЕ ДИАМЕТРА АПЕРТУРЫ ЗОНДИРУЮЩЕГО ЛАЗЕРА В НАЗЕМНЫХ АДАПТИВНЫХ ОПТИКОЭЛЕКТРОННЫХ СИСТЕМАХ ПРИ ФОРМИРОВАНИИ НАТРИЕВОЙ ОПОРНОЙ ЗВЕЗДЫ
- ПОДХОД К ПОЛУЧЕНИЮ ИЗОБРАЖЕНИЙ ОБЪЕКТОВ НА ОСНОВЕ ДАННЫХ НЕПРЯМОЙ ЛАЗЕРНОЙ ЛОКАЦИИ
- СТРАТЕГИЯ ПРОЕКТИРОВАНИЯ И УПРАВЛЕНИЕ ПРОЦЕССОМ КОРРЕКЦИИ АБЕРРАЦИЙ ОБЪЕКТИВА С ВЫСОКИМ ИНДЕКСОМ СЛОЖНОСТИ
- ФУРЬЕ-СПЕКТРОСКОПИЯ В ИССЛЕДОВАНИИ ПЛАЗМЫ КРОВИ С ДИАБЕТОМ ВТОРОГО ТИПА
- АНАЛИЗ ВЛИЯНИЯ РАСФОКУСИРОВКИ НА ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ ВОЛНОВОГО ФРОНТА ТЕЛЕСКОПА ПО ПЯТНУ РАССЕЯНИЯ МЕТОДОМ ПАРАМЕТРИЧЕСКОЙ ОПТИМИЗАЦИИ
- ПЕРСПЕКТИВЫ ИСПОЛЬЗОВАНИЯ БЕЗЭКИПАЖНЫХ ТРАНСПОРТНЫХ СУДОВ В МОРЯХ АРКТИЧЕСКОГО БАССЕЙНА РОССИИ
- ПОСТРОЕНИЕ ПСИХОЛОГИЧЕСКОГО ПОРТРЕТА ЧЕЛОВЕКА С ПРИМЕНЕНИЕМ ТЕХНОЛОГИЙ ОБРАБОТКИ ЕСТЕСТВЕННОГО ЯЗЫКА
- ХОРОШАЯ ТОЧКА: ОБУЧЕНИЕ БЕЗ УЧИТЕЛЯ ОБНАРУЖЕНИЮ И ОПИСАНИЮ ПО КЛЮЧЕВЫМ ТОЧКАМ
- МЕТОДЫ ПРОТИВОДЕЙСТВИЯ АТАКАМ ПОСРЕДСТВОМ СИНТЕЗА РЕЧИ НА ГОЛОСОВЫЕ БИОМЕТРИЧЕСКИЕ СИСТЕМЫ В БАНКОВСКОЙ СФЕРЕ
- МОДЕЛИРОВАНИЕ РАСПРОСТРАНЕНИЯ И ДИФРАКЦИИ УДАРНОЙ ВОЛНЫ В ПЛОСКОМ КОЛЬЦЕВОМ КАНАЛЕ
- АЛГОРИТМ ИДЕНТИФИКАЦИИ ПАРАМЕТРОВ ДВИГАТЕЛЕЙ ПОСТОЯННОГО ТОКА С ИСПОЛЬЗОВАНИЕМ МЕТОДА ДИНАМИЧЕСКОГО РАСШИРЕНИЯ РЕГРЕССОРА И СМЕШИВАНИЯ
- ПРОГНОЗИРОВАНИЕ ВЕСЕННЕГО ПОЛОВОДЬЯ РЕК С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ
- ОБЕСПЕЧЕНИЕ ГИБКОСТИ РОБОТИЗИРОВАННЫХ ТЕХНОЛОГИЧЕСКИХ СИСТЕМ ДЛЯ СБОРКИ МАЛОГАБАРИТНЫХ ИЗДЕЛИЙ